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MICROARCHITECTURE D' UNITE ARITHMETIQUE 

La presente invention concerne une 

microarchitecture d' unite arithmet ique . 

Les unites arithmetiques sont notamment utilisees 
dans des circuits integres programmables , tels des 
microprocesseurs ou microcontroleurs . Eiles permettent 
de realiser un certain nombre d' operations 
arithmetiques sur des operandes. Un domaine 
d' application bien' connu est le traitement de signal 
numerique, pour appliquer des f litres, des fonctions de 
transfert, des transf ormees, ... 

Une operation arithmetique couramment utilisee pour 
ces differents traitements, est' une operation dite de 
multiplication accumulation, par laquelle on calcule 
une somme de produits. Si on note A et B deux operandes 
d'entrees et Y le contenu d'un accumulateur , cette 
operation permet de calciiler RES=A.B-fY. 

Cette operation arithmetique^ necessite 

classiquement un accumulateur pour contenir le nouveau 
resultat RES, qui sera utilise a 1' iteration suivante, 
un multiplieur auquel sont appliques les deux operandes 
d' entree A et B, et un additionneur qui regoit en 
entrees le resultat de la multiplication A.B et le 
contenu courant Y de 1 ' accumulateur . En pratique, le 
contenu courant ' de 1 ' accumulateur est traiisfere dans 
1 ' additionneur par I' intermediaire d'un registre. Le 
resultat de I'operation' est lui transfere dans 
1 ' accumulateur . 

Une structure connue d'un multiplieur, - comprend un 
etage de multiplication pour calculer les produits 
partiels PI et P2 des deux operandes d' entree A et B, 
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ef uh etage additionneur pour ■ palculer la somme des 
produits partiels PI et P2 - 

En sortie, on obtient le resultat du produit des 
operandes d'entrees: A.B= P1+P2, 
5 . . ,.Cette technique de multiplication est bien connue 

de IVhonune du metier . 
. , , . Une microarchitecture d' unite arithmetique 
: permettant de realisier des operations de 
multiplication-accumulation et utilisant un tel 
10 multiplieur, comprend ainsi deux additionneurs en 
cascade. Selon 1 ' acception habituelle dans le domaine 
considere, il faut entendre par additionneur , ou 
additionneur. global, un circuit qui fournit le resultat 
de la somme de deux, operandes appliques en entree. Un 
15 .tel addit.ionneur peut par exemple etre du type a 
. retenue anticipee ou a propagation de retenue, 

Le premier additionneur permet de calculer la 
somme des ^ produits . partiels . ; le deuxieme additionneur 
permet d'ajouter. a cette somme, le contenu courant de 
20 1 ' accumulateur, et de f ournir en sortie le resultat 
- final, . correspondant . a 1' operation de multiplication 
accumulation... Ce ^ resultat est ensuite charge dans 
1 * accumulateur . _ . : , 

Le deuxieme, additionneur fournit. en outre un bit de 
25 retenue sortante,. qui correspond a la retenue de sortie 
. du . rang correspondant au bit le plus significatif du 
resultat. Dans un exemple, avec des operandes en format 
signe en complement a deux et un additionneur 40 bits 
le resultat a un format signe sur 40 bits, dont 1 bit 
,30. de signe au rang 39, et 39 bits significatif s de rang 
38 a 0, le rang, du bit le plus significatif etant le 
rang 38. La .retenue sortante . sera ainsi notee C39- 
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Cette r^teriae sortante €39/ ou son complementaire 
note B39, est habituellement memorisee dans* un registre 
d'etat. 

Ce registre d'etat comprend un certain" 'nombre de 

5 bits drapeau (flag) utilises par les programmeurs dans 
des equations logiques propres a 1' architecture 
consideree/ . . . 

Un probleme de la microarchitecture qui vient 
d'etre decrite est que les deux addit ionneurs en 

10 cascade bffrent un temps de calcul • non optimise, 
d'autant plus penalisant que les operandes a traiter 
sont codes sur de nombreux bits. Avec deux 
additiohneurs en cascade, le chemin de donnees est 
particulierement long. : - . . 

15' Une microarchitecture d'unite arithmetique - plus 

optimisee en terme de chemin de donnees utilise un 
circuit ' additionneur- a sauvegarde de retenue, 
generalement designe par 1 ' acronyme anglais CSA (pour 
Carry Save Adder) et qui permet de faire correspondre a 

20 trois entrees, deux sorties. Le temps de calcul total 
du resultat est alors egal au temps de calcul d'un seul 
bit. On fait ' suivre ce circuit additionneur a 
sauvegarde' de retenue par un additionneur, qui fournit 
ie "resultat final. On economise ainsi le temps de 

25 calcul d'uh additiorifieur moins le temps de calcul de 
1' additionneur CSA. 

Dans cette " microarchitecture, = le circuit 
"additionneur a 'sauvegarde de retenue regoit ainsi en 
entrees les deux produits partiels PI et P2 et le 

30 contenu courant Y de 1 ' accumulateur . II fournit en 
sortie un vecteur "retenue" et un. vecteur "resultat". 
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Ces deux vecteurs sont appliques en entrees de 
i; additdonneur, , qui fournit en sortie le resultat RES. 

Un probleme lie a cette microarchitecture 
optimisee, est que 1 'information de retenue sortante de 
5 l.'additionneur qui fournit le . resultat en sortie n'est 
pas , egale a celle obtenue . dans la premiere 
microarchitecture decrite, avec deux additionneurs en 
' ; cascade . . 

Ceci peut se comprendre, si I'on considere que les 
' . - : 10 . entrees .de- .1 ' additipnneur qui fournit le resultat et la 
retenue sortante ne sont pas les memes dans les deux 
microarchitectures : dans la premiere architecture, les 
deux entrees . de . cet. additionneur regoivent 1 ' une la 
somme des produits partiels et 1' autre, le contenu 
15 courant: de - 1 ' accumulateur . Daps, la microarchitecture 
- ^ . optimisee, il s.'.agit des deux vecteurs retenue et 
. resultat fournis par 1' additionneur a sauvegarde de 

^ retenue. Or chaque bit ..de. sort.ie de 1 'additionneur qui 

..-i- . fournit le resultat final est. elabore a partir des bits 
20 appliques en entree de .1 '.additionneur et. des retenues 
generees en. . .interne La. retenue sortante n'est rien 
d' autre que la derniere . retenue. interne jgeneree. On 
Gomprend que . 1 ' on obtienne le meme_ resultat en sortie 
de 1 ' additionneur, . mais avec. une retenue sortante 
, 25. dif ferente, , que I'on note 039' • Cette retenue peut etre 
appelee "retenue comprimee". . , , 

Pour illustrer.. ce , probleme, prenons I'exemple de 
trois operandes Ei, E2,. Y/. exprimes en complement a deux 
sur 4 bits . 
. 30 . El. = 1 1 1 0I2 = -2I10 £ , .: . 

- • E2 = 0' 0 0 1 I2 = 1 lio ' 

Y = 1 1 1 0I2 = -2I10 
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On a un additionneur N= 4 bits. La retenue 
sortante est la retenue de rang N-l=3, notee C3, 

5 ® Determination de la retenue sortante C3 f ournie 

•par "le deuxieme additionneur de la microarchitecture 
classique (2 additionneurs cascades) : . ■ 
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20 



El 


1 


1 


1. 


0 • 




E2 


0 


0 


0 


1 




Tmp 


1^ 


1^ 


1 


1 


R^stiltat du premier additionneur 


Y 


1 


1 


1 


0 




Res 


1 


1 


0 


1 


Resultat du deuxieme additionneur 


C3 


' 1 








avec retenue sortante • ' ' 




® 


Determination 


de la retenue sortante comprimee 


C'3 


f ournie 


par 


1 ' additionneur qui fourriit le resultat 


final dans 


la microarchitecture optimisee (Additionneur 


CSA 


et 


additionneur i 


en cascade) : ' 


El 


1 


■ i- 


1 


0 




E2 


0 


0 


6 


1 




Y ' 


1 


: . -|_ , 


1 


0 ^' 




E 


0 


0 


0 


1 


Additionneur CSA ; Vecteur RSsultat 


R 


1 


1 


0 




et Vecteur Retenue 


Res 


1 


1 


0 


1 


Resultat additionneur final 




0 








et retenue sortante comprimee 




On 


voit dans cet example que la retenue sortante 



.30 comprimee C3' ne correspond pas a la retenue sortante 
C3 . " , ' 
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Ainsi, la retenue sortante comprimee ne correspond 
pas a la definition' du bit . drapeau correspondant dans 
le registre d'etat-. . . 

Un objet de 1' invention est 1 • optimisation d'une 
microarchitecture d' unite arithmetique* en sorte que la 
microarchitecture optimisee s.oit ■ equivalente a la 
microarchitecture- classique. Notamment, ^ .la nouvelle 
microarchitecture doit foiirnir les memes bits drapeau 
du registre d'etat, en sorte que 1 ' utilisation des ces 
bits drapeau par un programmeur soit. independante ,de la 
microarchitecture * ef fiectivement implement ee. 

Une solution a ce probleme technique a ete trouvee 
dans/ I'inVentipn, " en"- determinant la valour de la 
retenue sortante rconsideree a partir d! equations 
logiques definies en rapport a la microarchitzecture 
initiale. , - • : . •? / 

Pour cette determination, on a etendu de N a N+1 
l.Vadditionneur final et . 1 Vaccumulateur pour determiner 
la valeur de la rejtenue ^ortante : CN--i;.a partir des bits 
de rang N le plus eleve du resultat en sortie de 
1 ' additionneur final et du contenu courant de 
1 ' accumulateur . En utilisant dans la microarchitecture 
un additionneur final et un • accjumulateur etendus a N+1 
bits, on dispose alors en direct de ces -bits qui sont 
les memes dans les deux microarchitectures, et par 
lesquels on. peut .recalc.ul.er .la valeur de la retenue 
sortante correspondant a la premiere microarchitecture . 

Cette retenue sortante est aussi fonction du bit de 
rang le plus eleve de la somme des produits partiels. 
Cette somme n'est pas connue " par la cascade de 
1 ' additionneur CSA avec lin additionneur qui ' f oiirnit le 
resultat final. 
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Selon 1' invention, on prevoit done • un circuit 
additionneur pour calculer la somme des produits 
partiels. La structure de cet additionneur est 
indifferente et peut-etre optimisee en termes de 
5 circuiterie et de chemin de donnees, puisque seul le 
bit de rang le plus' eleve est utilise en sortie. On 
peut montrer qu ' en terrue de circuiterie, cet 
additionneur supplementaire represente moins de 1% de 
la circuiterie de reunite arithmetique ^ 
10 Un circuit combfnatoire est enfin • prevu : pour 

combiner de maniere appropriee les differents bits 
permettant de determineir la valeur de la retenue 
sort ante- 

De fagon plus generale, I'unite arithmetique peut 

15 mettre en oeuvre d'autres operations arithmetiques 
utilisant la structure cascade de 1 ' additionneur a 
sauvegarde de retenue de 1 * additionneur final pour 

* des operations de type accumulation. En effet cette 
structure cascade permetde calculer un resultat RES en 

20 sortie, ctorrespondant a la somme d'au moins un operande 
d* entree quelcorique avec le contenu courant de 
1 • accumulateur . L ' additionneur CSA comportant trois 
entrees, une des entrees peut etre forcee a zero. 

Par exemple, dans urie application particuliere 

25 permettant de f aire des accumulations de ' nombres en 
double precision, on ' cherche a calculer la - somme entre 
le resultat d'une ' concatenation de - deux autres 
operandes et le contenu courant de 1 ' accumulateur . Dans 
ce cas, le bit de' retenue sortante peut etre determine 

30 en utilisant directement le bit de rang le plus eleve 
du nombre concatene, en combinaison avec les bits de 
rang le plus eleve du resultat en sortie de 
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1 ' addltionneur final et du ^ contenu courant de 
1 ' accumulateur - 

Telle qu'elle est* . caracterisee, 1' invention concerne 
done . una . microarchitecture d'une unite arithmetique, 
ladite unite arithmetique etant def inie pour f ournir un 
resultat sur N bits de rang 0 a N-l d'une addition d'au 
moins .d^ux operandes, et . un bit correspondant de 
retenue sortante, ladite. microarchitecture comprenant 
un additionneur . a .sauyegarde de retenue pour f ournir 
deux .vecteurs de sortie ,a partir d'au moins deux 
operandes d'entree, . un desdits operandes correspondant 
au contenu courant d'un accumulateur et un. additionneur 
final recevant en entrees les dits . vecteurs et 
fournissant en sortie un resultat , correspondant, 
caracterise • en , ce gue dans ladite microarchitecture, 
.1 ' additionneur :a sauvegarde de ^ retenue, 1 ' additionneur 
final et . 1 *-accumul.ate,ur sont des circuits N+1 bits, 
pour appliquer le .bit , de rang . N . le plus eleve du 
resultat fourni par : ledit ^ additionneur final et le bit 
de rang N ,le plus. .eleve-. de, .1 ; operande correspondant. au 
contenu courant: de . .1/ accumulateur a. un circuit de 
determination dudit .bit- ,de retenue sortante. 

• D'autres caracteristiques et avantages de 
1* invention sont., detailles . dans la description 
suivante, faite a titre indicatif et non limitatif, et 
en ^reference aux- dessins annexes dans lesquels^ : 

. --la figure 1 re^.resente une microarchitecture d'une 
unite arithmetique, a . deux addit.ionneurs en cascade; 

-la. figure.. 2. represente , une microarchitecture 
optimisee d'. une unite arithmetique avec^ un exemple de 
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realisation d ' uh circuit de determination ■ de la retenue 
sortante selon 1* invention; et 

-la figure 3 represente une microarchitecture 
optimisee d'une unite arithmetique avec un autre 
exemple de realisation d'un circuit de determination de 
la retenue sortante selon 1* invention. - 

La ' figure ' 1 represente une unite arithmetique 
permettant notamment de - realiser des operations de 
multiplication accumulation. Dans 1* exemple, elle 
permet aussi de realiser des operations d ' accumulation 
de nombre en double precision, au moyen d'un circuit de 
concatenation. 

Dans cette microarchitecture, 1' unite arithmetique 
comprend un multiplieur 1 de deux- operandes OPA, OPB 
appliques en entrees de" I'unite arithmetique. Ce 
multiplieur comprend uri" ' circuit 2. de calcul des 
produits partiels PI "et P2 des operandes d * entree suivi 
d'lin additionneur 3 qui fournit en sortie • le resultat P 
de bette multiplication, dont le format est le double 
des operandes d'entree. ~ 

Dans' 1' exemple, cette unite arithmetique comprend 
auSsi un "circuit 20 de concatenation des deux operandes 
d'entree OPA et OPB. 11 fournit" en sortie un nombre 
concatene NC, dont le format est le double du format 
des operandes d'entree. 

L'un ou ^ I'autre de ces^ resultats P ou NC est 
applique sur une premiere entree A d'un additionneur 4. 
L'autre entree B de " 1 ' additionneur regoit le contenu Y 
d'un registre 5 a decalage. Ce • regis'tre 5 regoit en 
debut d' operation, le contenu • courant ACCU de 
1 ' accumulateur 6. 
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.. .Le resultat.- RES . est f9urni. en sortie de 
I'additionneur 4, et transfere dans. 1 ' accumulateur 6 
r * pour, former le nouveau contenu courant de cet 
.accumulateur, qui servira a 1 '.iteration sulvante. Le 
5; contenu de 1 • accumulateur vu de 1 ' architecture generale 
du circuity et accessible par un .programmeur est note 
RESu et correspond au contenu ACCU de 1 • accumulateur 6. 
. . - ; En pratique le .format de 1 ^additionneur 4, de 

. . I'accumula.teur 6 et du. registre 5 assoc.ie est superieur 
10 au -format des resultat s P. e.t NC. Aussi, ces resultats 
: . sont-ils prealablement etendus avant d'etre appliques a 
•I'additionneur. 

Dans I'exemple, on s ' interesse a un format signe en 
' -. complement a deux...Aussi .1' extension de. format est-elle 

15 une extension du signe. ... . 

; L' unite ; arithmetique .comprend . done un multiplexeur 

MUX 7 pour, appliquer. soit le resultat. P, soit le 
'^; :resultat NC sur . .I'entree A .. de I'additionneur 4, en 
fonetion - de 1.' operation a realiser, . suivi d'.un circuit 
-.20 ■ d'extension- du bit de. -.signe , SXT 8, pour mettre le 
resultat select ionne au format de 1 '.additi.onneur . 

Le: multiplexeur . T est ainsi commande par un signal 
• logique insl . fonetion de 1' operation a , realiser, 
multiplication-accumulation ou accumulation ..en double 
25 ♦ • precision, . pour sele.ctlonner 1 ' une. ou 1 ' autre des voies 
d'entree du multiplexeur. - • 

L' additionneur . 4 fournit un bit de retenue, qui est 
la retenue sortante de.J.'et^ge d ' elaboration du bit le 
• plus, signif icatif du "resiiltat . : . 
^30 Dans. I'exemple, I'additionneur 4.. est un 

• : additionneur 40 bits fournissant un resultat RES sur 40 
bits . v , 
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En format s'igne en complement a deux, on a ainsi 1 
bit de signe RES[39] au rang 39 et 39 bits signif icatif s 
RES[38:0] de rangs 38 a 0, le bit le plus signif icatif 
etant le bit de rang 38. Ainsi, la retenue sortante de 
cet additionneur est-elle notee C39. 

D'une maniere generale, dans un additionneur N bits 
fournissant un resultat RES[N-1:0], la retenue sortante 
est notee Cn-i-. 

Cette retenue sortante fournie par 1* additionneur 4 
est habituellement memorisee dans un registre d'etat 7. 
Ceci^se fait au moyen d'un circuit logique 8 comprenant 
un inverseur 9 et un multiplexeur 10. L'lnverseur 9 
f ournit le bit complementaire B39 du bit de retenue 
sortante C39. Le multiplexeur 10 transmet au registre 
d'etat. If un bit de drapeau Cflag egal au bit de retenue 
C39 ou au bit de retenue complementaire B39 {Borrow, dans 
la litterature anglo-saxonne) selon que 1' operation 
arithmetique . realisee avec 1 ' accumulateur est une 
.addition (P+ACCU) ou une soustraction (P-ACCU ou 
ACCU-P) . Dans le premier cas on a une retenue positive. 
Dans le second cas, on a une retenue negative - 

Dans I'exemple represents sur la figure 1, on 
considere des operandes en format signe en complement a 
deux. Les operandes OPA, OPB appliques en entree de 
1' unite arithmetique ont un format signe sur 17 bits : 
un bit de signe (rang 16) et 16 bits signif icatif s 
(rangs 15 a._0) . Les. resultats P et NC ont un format 
signe sur 34 bits. 

Quant a 1 ' accumulateur io, au registre a decalage 5 
associe et a 1 ' additionneur 4, ce sorit des circuits de 
40 bits. Le circuit d' extension de format consiste de 
fagon connue a r'ecopier le bit de signe donne par le 
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bit- de -rang 33 des. operandes-.P ou NC.et .a recopier ce 
bit aux rangs superieurs 34 a 39. ^ 

Une structure optimisee d'une . telle unite 
arithmetique est representee sur la figure 2. 

Un moyen d'optimiser un chemin de donnees 
comprenant des additionneurs en cascade est d'utiliser 
des additionneurs a sauvegarde de retenue, et un 
additionneur dans le dernier etage de la cascade. 

Applique a la microarchitecture representee sur la 
figure 1, 1 ' additionneur 3 est* sorti du circuit 
multiplieur 1, et remplace dans la figure 2 par un 
additionneur 11 a sauvegarde de retehue^ du type a 
trois entrees F, G, et H vers deux sorties. 

Pour assurer un fonctionnement equivalent a celui 
de la microarchitecture representee sur la figure 1, 
cet additionneur 11 doit permettre de calciiler la somme 
des produits partiels "'Pl et P2 et du contenu Y du 
registre, ou la somfne' dii nombre concatene NC et du 
contenu Y du registre, eri fonction de 1' operation a 
realiser. En outre les re"sultats PI, P2 et ' NC doivent 
toujours etre mis au format de 1 ' additionneur , done 
subir une extension de format. A deux entrees de 
1 ' additionneur 11, sent done as'socies un multiplexeur 
et un ^ circuit d*extension de format, tandis que la 
troisi4me entree regoit directement le ' contenu Y du 
registre 5 (correspondant au 'contenu cburant de 
1 • accumuiateur ) . 

Une premiere entree F de " 1 ' additionneur est 

associee au produit partiel Pl[33:0] et au nombre 
concatene NC[33:0].. Un. premier multiplexeur .MUX 12 
,regoit . ainsi en entree le produit partiel PI, et le 
•nombre. concatene NC pour transmettre I'un^oul* autre en 
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sortie Ml - eh' fonction de ■■ 1* operation en cours, 
determinee par le signal logique insl. Ce premier 
multiplexeur est suivi d'un circuit 13 d' extension de 
format, qui fournit I'operande El appliqiae sur la 
premiere entree F de 1 • additionneur 11. 

■ Une deuxieme entree G est associee au produit 
partial P2[33:0] et a un vecteur nul" VN[33:0]. En effet, 
dans le cas d'une operation d * accumulation en double 
precision qui realise 1' operation NC+Y, la deuxieme 
entree de 1 ' additionneur 11 n'est pas utilisee. On la 
force done a zero. On a ainsi un multiplexeur MUX 14 
qui regoit en entrees le produit partiel P2 et le 
vecteur nul VN . II tran'smet 1 * un ou 1 ' autre en sortie 
M2 en fonction de 1* operation en cours/ determinee par 
le signal logique insl. Ce multiplexeur' 14 est suivi 
d'un circuit' 15 d'extension de format, qui fournit 
I' operande E2 applique * sur la deuxieme entree G de 
1 • additionneur 11. 

^ Une troisieme ' entree ' H de 1 * additionneur 11 regoit 
I' opeirande Y ' f o'urni par le registre 5 associe a 
1 ' accumulateur . 

En fonction des operandes ' El, E2 et Y, 
1 'additionneur a ' sauvegarde de retenue 11 fournit en 
sortie deux vecteufs : un vecteur somme* VS et un 
vecteur retenue VR. 

Ces vecteur s somme ViS 'et retenue VR sont appliques 
en entree de 1' additionneur 4 a propagation de retenue, 
qui trahsmet ' le resultat RES obtenu, dans 
1 ' accumulateur 6. 

Si on compare les microarchitectures des figures 1 
et 2, 'oh constate que 1 ' additionneur ;4 a propagation de 
retenue n'a pas les memes entrees dans les deux : dans 
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la premiere (f igure 1) . ses entrees sont E et Y ; dans 
la deuxieme (figure 2), ses entrees sont VS et VR. 

• Comme .cet additio.nneur 4 n'a pas les memes entrees 
dans la microarchitecture optimisee (figure 2), on 
obtient bien le meme resultat dans 1 ' accumulateur, mais 
I'a retenue . sortante cpmprimee^ C39' de 1 ' additionneur 3 
n'est -pas. egal.e. a la retenue- sortante^ C39 de 
1 ' additio.nneur 3 dans la microarchitecture . representee 
a la figure 1 . . . . . . 

Or il est necessaire de transmettre . cette retenue 
C39, et no.n la retenue comprimee . C39 ' f au registre d'etat 
1, pour permettre a 1' unite arithmetique d' assurer le 
meme f onctionnement dans les deux microarchitectures. 
Notamment , tous . les.,^ traitements (depassement , 
saturation, calculs multi-precision,..) effectues en 
fonction du bit drapeau Cflag memorise dans le registre 
d'etat 7 doivent pouvoir.. etre conduits de. la meme fagon 
dans les deux microarchitectures. 

- Selon , 1' invention,, la microarchitecture representee 
a la figure 2 comprend un. dispositif de. .det;erminat;ion 
de la retenue sortante 039- 

Ce./ dispositif., es,t.. base . sur . une determination 
arithmetique de la , valeur de . cette . retenue, 
. relativement .a ...la microarchitecture de I'unite 
arithmetique de la figure 1 .et utilisant des op.erandes 
que. I' on , peu.t obtenir. dans la deuxieme architecture, 
.sans necessiter une circuiterie cqmplexe. 

Dans la premiere .microarchitecture, on note : 

RES[i] le bit de rang, .i du resultat de 
1 ' additionneur. 4 ; . - 

Ci .la retenue •^interne sortant- du rang, i; 
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E[i], le bit de rang i du premier operande d' entree 
de cet additionneur A, corres'pondant soit a la somme 
(etendue) des produits partiels, soit au resultat de la 
concatena:tlon; 

Y[i], le bit de rang i du deuxieme operande d'entree 
de cet additionneur, correspondant au ' cohtenu courant 
de 1 * accumulateur , fourni par le registre 4; 

On peut ecrire: 

RES[i + l]=E[i+l] xbR Y[i+1] X0R 'C±- (eql) ^ 
Et 

Ci+i= E[i].Y[i]' + Ci.(E[i] XOR Y[i]) "■ (eq2) 
Ces equations eql et- eq2 sont les equations 
generales d'un additionneur: bits, avec des operandes 
sur N bits, E[N-1:0] et Y[N-1:0] et un resultat sur N 
bits .RES[N-1:0]. La retenue sortante de 1 • additionneur 
est alors la retenue Cn-i sortant du rang iN-l. Cette 
retenue^ sortante Cn-i/ peut etre uti'lisee pour calculer 
le bit somme de rang- N dans un additionneur etendu a 
N+lbits. Oh a alors : 

■ ' RES[N] = E[N] XOR -Y[N] XOR Cn-i^ (eq3) 

Avec un additionneur N+l=41 bits (N=4 0) comme 
deuxieme additionneur 4 dans la microarchitecture de la 
figure 1, le bit ie plus signlficatif RES[40] du 
resultat s'ecrirait done : • 

RES[40] = E[4 0] XOR Y[4 0^] xoR C39 ' d'ou il vient 
'■ 039= E[40] XOR Y[40] XOR RES[40] (eq4) ■ 

Si on se reporte a la figure 1, le bit de rang 40 
de 1* operande E est, en fonction du signal logique 
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insl, soit egal au .bit de rang . 40 du nombre concat6ne 
NC, apres extension, de format, qui est Equivalent au 
bit de rang 33 de ce. nombre : NC[33] . ; soit egal au bit 
de rang 4 0 de la somme P des produi.ts .partiels PI et 
P2,. apres extension .,de format, ce qui est equivalent au 
bit de rang 33 de cette -somme : P[33].. 

Plus -generalement, . si on. note .: S[33:0] I'operande 
fourni en sortie du multiplexeur 7 dans la figure 1, le 
bit de rang 40 de I'operande E est 6.gal,au bit de rang 
33 de cet^operande S. L '.equation .. eq4 peut done aussi 
s ' ecrire : 

C39- S[33], XOR Y[40] XOR RES[4p] (?q5) 
ou S[33] est., egal a NG[33] pu P[33]. 
Of 1^ bit NC[33]= est cbnriu directement. 
II en ressort que. -'dans la. microarchitecture 
optiihisee representee ,sur - la figure 2, .en .p>revoyant un 
additionneur 4 . et un acpumulateur 6 etendus ^ N+1 bits, 
soit 41. bits, dans. 1,' ejtemple, . la ^eule . iocpnnue k la 
determination de la^ .reteniie sortante C39 est P.[33]. 

Dans ce cas, il : faut aussi preyoir. que 
1' additionneur CSA. 11 ..soit-. un : additionneur 41 bits. Les 
circuits d' extension de format deviennent des circuits 
d' extension a 41 bits,. . . .; . . 

-Ainsi - corame - represente . sur la , figure 2, 
1' additionneur CSA 11 r^egoi.t des operandes etendus a 41 
bits : El[40:0], E2[40.: 0]. , et Y.[40.:0], et fournit des 
vecteurs somme et; r^sultats sur 41 , bits VR[40:0] et 
VS[40:0].; Ces yecteurs soinme et resultat sont appliques 
a 1 'additionneur 4 qui fournit un resultat sur 41 bits 
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RES[40:0] qui est transfere ensuite dans un accumulateur 
6 41 bits avec un registre 5 associe 41 bits. 

Pour gardef 1' equivalence entre les deux 
microarchitectures, on prevoit que seuls les N. premiers 
bits de 1' kccumulateur sont accessibles du programmeur 
en lecture. En d'autres termes RESu = ACCU[39:0]. 

Plusieurs mode de realisation d ' un circuit de 
determination du bit de retenue C39 selon 1' invention 
sont possibles, selon Inequation logique utilisee eq4 
ou eq5 et selon que 1 ' on discrimine les ;Operandes a 
traiter, selon 1* operation en cours, ou pas. 

Dans tous les cas, le circuit de determination de 
la retenue sortante C39 comprend un circuit d' evaluation 
du bit de rang le plus eleve-. de la somme des operandes 
El ' et E2 appliques .en entree de 1 ' additionneur a 
sauvegarde de retenue, /ou des . operandes equivalents. En 
pratique, selon la mise en oe.uvre,..et en se referant a 
la figure 1,- on peut. - obtenir en sortie de ce circuit 
d'evaluation, soit 'E[40], soit S[33],. soit P[33]. 

' ■ Dans un premier ekemple .de . realisation pratique du 
dispositif de. determi nation ,,:de la retenue sortante C39 
represente : sur la figure .2, ce dispositif 16 de 
determination comprend un circuit d' evaluation du bit 
S[33], ' et un circuit logique. 18 mettant en oeuvre 
I'equation logique (XOR) . entre les bits de I'equation 
eq5 • * . 

Le circuit 17 d'evaluation du bit S[33] est base 
sur un additionneur, . auquel sont appliques en entree 
les sorties Ml et. ; M2 des multiplexeurs 12 et 14. On 
obtient en sortie un resultat S[33 : 0]=M1[33 : 0]+M2[33 : 0] . 
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Cet additionneur a en. pratique une structure 
limitee au strict necessaire pour sortir le bit qui 
nous interesse, a . savoir . le bit S[33]. Cette structure 
peut etre de n'importe quel type, la plus optimisee de 
preference, en termes de pircuiterie et de chemin de 
dbnhees . ' ... , - - . • . 

On -notera quei.l'on pourralt aus.si bien appliquer en 
entree" de .cet additionneur les operandes. El et E2 de 
1' additionneur a., sauyegarde de retenue, pour obtenir 
E[4'0].' Mais le chemin de donnee , est necessairement plus 
long, be qui n ' est : pas- interessant en pratique. 

En- pratique, -tout'e la structure de cet additionneur 
n'a pas a- -etre ' impl.ementee.: Seuls- . les _ elements 
nedessalres • k 1' evaluation - du bit de rang 33 de la 
somme *doit -etre-mise en oeuvre. La structure utilisee 
peut etre optimisee en.terme de circuiterie et de 
chemiri' de donnees.- ■•*• - : . . : 

Selori - ' que - ••reoperation concernee ;est une 
accumulation: eri double precision ou^ uae^. muLtiplication- 
accumulation,- ce bit ';S[33] correspond en pratique ; au ^bit 
de rang 33* du ndmbre'- NC,:- car alors M1=NQ et :M2=VN ; ou 
au^^bit -de fang 33 de la'.somme P des produits^ partiels, 
car alors M1=P1 et'- M2=P2 ' - ... • 

. Le circuit -lo.gique ^18_ de type XOR du circuit de 
determination 16^. regroif done , en entrees, . ce bit-. S[33], 
le bit de rang 4 0 du contenu courant Y de 
I'accumulateur, -donne par le registre 5, soit Y[40], et 
le bit de rang 40^ du . resultat RES. eri:. sortie de 
1 'additionneur, soit "RES[40]. * - ^ * * 
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II fournit en sortie ie bit de retenue sortante du 
rang 39^ C39, applique en entree du circuit 8, pour etre 
memorise dans le registre d'etat 7. 

Ainsi, 1' unite arithmetique representee est 
optimisee en terme de chemin de donnee * et done de 
Vitesse^ ■ tout en fournissant un resultat complete 
equivalent a la microarchitecture non optimisee a deux 
additionneurs cascades de la figure 1. 

La logique supplementaire necessaire pour evaluer 
le bit de retenue sortante est insignif iante au regard 
de la logique de 1' unite arithmetique complete. 

Une telle unite arithmetique optimisee est done 
particulierement avantageuse^ dans toutes les 
applications ou la vitesse de traitement de donnees est 
cruciale . 

Sur la figure 3, on a representee une variante de 
realisation du circuit 16 d'evaluation de la retenue 
sortante C39. Dans cette variante on discrimine les 
operandes a considerer pour 1' evaluation du bit S[33] en 
fonction de 1' operation a realiser. On a done une 
structure plus specif ique. 

Dans cet exemple, 1 ' additionneur 17 du circuit 
d' evaluation du bit S[33] regoit en entrees les produits 
partiels PI et P2 et fournit en sortie la somme P 
resultante, ou plus exactement le bit de rang 33 de 
cette somme : P[33]. 

Le circuit d' evaluation du bit S[33] comprend en 
outre un multiplexeur 19, qui regoit en entrees ce bit 
P[33] et le bit de rang 33 du nombre concatene NC, soit 
NC[33]. Ce multiplexeur 19 fournit en sortie le bit S[33] 
applique en entree du circuit logique 18, Ce bit est 
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egal soit au bit .P[33] soit :au bit NC[33] en fonction de 
1' operation courante concernee, determinee par le 
signal de commande insl applique., au multiplexeur 19. 

Quelque soit . la yariante - retenue, elle necessite 
peu de circuiterie et permet . d'utiliser une 
microarchitecture-. optimisee, equivalente . a la 
microarchitecture d'ordgine, en sorte quVelle peut etre 
utilisee a . sa place dans un circuit a microprocesseur, 
en toute equivalence.;- * -^.^ 
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REVENDICATIONS 

1. Microarchitecture d'une unite afithmetique, 
ladite unite arithmetique etant 'def inie pour fournir un 
resultat (RESu) sur N bits de rang 0 a N-1 d'une 
addition d"au moins deux operandes^ et un bit 
correspondant de retenue • sortante (C39) , ladite 
microarchitecture comprenant un additionneur a 
sauvegarde de retenue (11) pour fournir deux vecteurs 
de sortie (VS, VR) a partir d'au moins deux/ operandes 
d' entree, un desdits operandes correspondant au contenu 
courant d'un accumulateur (6) , et un additionneur final 
(4) recevant en entrees les dits vecteurs (VS, VR) et 
fournissant en sortie un resultat correspondant (RES), 
caracterise en ce que dans ladite microarchitecture, 
1 ' additionneur a sauvegarde de retenue, 1 ' additionneur 
final et 1 ' accumulateur sorit des circuits N+1 bits, 
pour appliquer le bit de rang N . le plus, eleve du 
resultat (RES) fburni par ledit additionneur final (4) 
et le bit de rang N le plus eleve de I'operande (Y) 
correspondant au contenu courant de 1 ' accumulateur (6) 
a un circuit (16) de determination dudit bit de retenue 
sortante (C39) . * , 

2. Microarchitecture d'une unite arithmetique 
selon ia revendicat ion 1, ledit additionneur a 
sauvegarde de retenue recevant en entrees un premier 
(El), un deuxieme (E2) et troisieme (y) operandes, 
ledit troisieme operande (Y) correspondant au contenu 
courant de 1 ' accumulateur (6), caracterise en ce que 
ledit circuit (16) de determination du bit de retenue 
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sortante (C39) comprend un circuit d ' evaluation (17) du 

bit de rang le plus eleve (S[33]) de la sonime desdits 

premier et deuxieme operandes d' entree (El, E2) ou 
d' pp^randes equivalents (Ml, M2) . 

% 3..; Microarchitecture selon la revendication 2, 
caracterise. .en ce que, ledit circuit d'evaluation (17) 
comprend les elements necessaires, d.'un. additionneur 
pour fourriir le bit : (S[33]) de rang . le plus eleve de 
ladite somme- 

4. Microarchitecture selon la revendication' 2 ou 
3, caracterise en ce que le bit evalue' (S[33]) fourni 
par ledit circuit d'evaluation, le bit de rang N (Y[40]) 
du contenu. courant. (Y) de I'accumulateur (6) et le bit 
de. rang . N (RE5[40]) . .du, ,resultat (RES) . fourni . par 
1' additionneur- final (.4).' spnt appliq.iies ^a uii circuit 
logique ,: (1-8). de type ,.0U EXCLUSIF .qui fourni^. en sortie 
'ladite retenue sortante (Cjg) . . . . 

. 5. Microarchitecture- • ■ ;selon .1'",'^® '^^^ 

revendications 2 a 5 comprenant un -multiplieur (1) pour 
fournir les produits partiels (PI, P2) de deux 
operandes (OPA, OPB) appliques en entrees de 1 ' unite 
arithmetique, caracterise en ce que lesdits produits 
partie.ls (PI, P2) sont appliques ' comme premier et 
deuxieme operandes d'e^tree (El, E2) de I' additionneur 
a sauvegarde de retenue (11). 

•. 6. . Microarchitecture selon la revendication 2, 
caracterise en ce qu'elle comprend un circuit (20) de 
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concatenation d'operandes (GPA, OPB) -appliques en 
entree de 1' unite arithmetique, fournissant en sortie 
un nombre concatene (NC) pour realiser des operations 
d ' accumulation en double precision avec le contenu 
courant de 1 ' accumulateur (6):, ledit nombre concatene 
(NC) etant applique comme premier operande d* entree 
dudit additionneur a saiivegarde de' retenue (11), le dit 
deuxieme operande etant force au vecteur nul (VN) . 

7. ' Microarchitecture selon Id revendication 6 
prise en combinaison avec la revendication 5, 
caracterise en ce que le multiplieur et le dispositif 
de concatenation sont places en parallele, un circuit 
multiplexeur (12, 13) etarit prevu pour appliquer soit 
le nombre concatene (NC) et le vecteur nul (VN) , soit 
lesdits produits partiels (PI, P2), comme premier (El) 
et deuxieme (E2) operandes d* entree de 1 ' additionneur a 
sauvegarde de retenue (11), selon que I'operation en 
cours utilise le circuit de concatenation (20) ou le 
multiplieur (1) . 

8. Microarchitecture selon la revendication 7, 
caracterisee en ce que le circuit de determination (16) 
du bit de retenue sortante comprend un circuit 
multiplexeur (19) pour fournir comme bit evalue (S[33]) , 
soit le bit (P[33]) fourni par le circuit d'evaluation 
(17), soit le bit de rang le plus eleve (NC[33]) du 
nombre concatene (NC) , selon que 1' operation en cours 
utilise le circuit de concatenation (20) ou le 
multiplieur (1) . 
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9. Microarchitecture selpn revendication 2 ou 

3, prise en combinaison avec 1 ' une quelconque des 
revendications 4 a 8, un circuit a extension de format 
(13,15) etant prevu pour .etendre a . N+1 bits les 
operandes appliques comme premier et deuxieme operandes 

' , d' entree (El,, E2) de, 1 ' additionneur a sauvegarde de 
reten.ue. :.(11), . , caracterise, . en . ce , que le circuit 

: . d' evaluation (17) du. circuit de determination (16) de 
la retenue sortante (C39) revolt en entrees des 
operandes.^ (Ml, M2) correspondant auxdits premier et 
deuxieme operandes .. d • entrees (El, E2), avant extension 
de format. . ... 
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10. . Microprocesseur ou Microcontroleur comprenant 
•une unite arithmetique ayant une. microarchitecture 
selon I'une quelconque. ^ des. revendications, 1 a 9. 
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